Revisão de Artigos — Instruções com Seguimento, Aderência à Segurança e Expressões Estáveis em RAG com Agentes
Exploramos novos artigos sobre avaliação de seguimento de instruções (FireBench), resolução teórica de alinhamento RLHF, estabilidade de representações internas e sistematização de Agentic RAG (SoK).